智能论文笔记

A novel learning-based robust model predictive control energy management strategy for fuel cell electric vehicles

Shibo Li , Zhuoran Hou , Liang Chu , Jingjing Jiang , Yuanjian Zhang

分类：机器学习

2022-09-12

多源机电耦合使燃料电池电动汽车（FCEV）的能源管理相对非线性和复杂，尤其是在4轮驱动（4WD）FCEV的类型中。复杂的非线性系统的准确观察状态是FCEV中出色的能源管理的基础。为了释放FCEV的节能潜力，为4WD FCEV提出了一种基于学习的新型鲁棒模型预测控制（LRMPC）策略，从而有助于多个能源之间的合适功率分布。基于机器学习（ML）的精心设计的策略将非线性系统的知识转化为具有出色稳健性能的显式控制方案。首先，具有高回归准确性和出色概括能力的ML方法是离线训练的，以建立SOC的精确状态观察者。然后，使用国家观察者生成的SOC的显式数据表用于抓住准确的状态更改，其输入功能包括车辆状态和车辆组件状态。具体来说，提供未来速度参考的车辆速度估计是由深森林构建的。接下来，将包括显式数据表和车辆速度估计的组件与模型预测控制（MPC）结合使用，以释放FCEV中多释放系统的最新能源节能能力，其名称是LRMPC。最后，在模拟测试中进行详细评估以验证LRMPC的进步性能。相应的结果突出了LRMPC的最佳控制效应和强大的实时应用能力。

translated by 谷歌翻译

N-Grammer: Augmenting Transformers with latent n-grams

Aurko Roy , Rohan Anil , Guangda Lai , Benjamin Lee , Jeffrey Zhao , Shuyuan Zhang , Shibo Wang , Ye Zhang , Shen Wu , Rigel Swavely

分类：自然语言处理 | 机器学习

2022-07-13

变压器模型最近已成为自然语言处理中的基础模型之一，作为副产品，最近对扩展这些模型具有重大的兴趣和投资。但是，这些大型变压器语言模型的培训和推理成本令人难以置信，因此需要更多的研究来识别更有效的变体。在这项工作中，我们通过用统计语言建模中的文献启发的变压器体系结构提出了一个简单而有效的修改，该架构是通过通过文本序列的离散潜在表示构建的n-grams来增强模型的。我们评估了我们的模型，关于C4数据集的语言建模的N-Strammer以及Superglue数据集的文本分类，并发现它的表现优于诸如变压器和底漆等几个强基线。我们为JAX中的可重复性目的开放源模型。

translated by 谷歌翻译

BertNet: Harvesting Knowledge Graphs from Pretrained Language Models

Shibo Hao , Bowen Tan , Kaiwen Tang , Hengzhe Zhang , Eric P Xing , Zhiting Hu

分类：自然语言处理

2022-06-28

符号知识图（kgs）是通过昂贵的人众包或特定于域特异性的复杂信息提取管道来构建的。诸如BERT之类的新兴大型语言模型（LMS）已显示出隐式编码的大量知识，可以使用正确设计的提示来查询。但是，与明确的公斤相比，黑盒LMS中的知识通常很难访问或编辑，并且缺乏解释性。在这项工作中，我们旨在从LMS收获符号KG，这是一个由神经LMS的灵活性和可扩展性增强的自动kg构造的新框架。与通常依赖大型人类注释的数据或现有大量KG的先前作品相比，我们的方法仅需要对关系的最小定义作为输入，因此适合于以前无法提取有关丰富新关系的知识。该方法会自动生成多样化的提示，并在给定的LM内执行有效的知识搜索，以进行一致和广泛的输出。与以前的方法相比，使用我们的方法收获的知识要准确得多，如自动和人类评估所示。结果，我们源于多元化的LMS，一个新的KG家族（例如Bertnet和Robertanet），其中包含一套更丰富的常识关系，包括复杂的关系（例如，A对B的能力，但不擅长B”）人类注销的kg（例如概念网）。此外，由此产生的kg也是解释各自的源LMS的工具，从而导致对不同LMS不同知识能力的新见解。

translated by 谷歌翻译

CoughTrigger: Earbuds IMU Based Cough Detection Activator Using An Energy-efficient Sensitivity-prioritized Time Series Classifier

Shibo Zhang , Ebrahim Nemati , Minh Dinh , Nathan Folkman , Tousif Ahmed , Mahbubur Rahman , Jilong Kuang , Nabil Alshurafa , Alex Gao

分类：机器学习

2021-11-07

持续咳嗽是呼吸系统疾病的主要症状。通过可穿戴物品来检测咳嗽，特别是在Covid-19大流行期间，已经支付了越来越多的研究。在所有类型的传感器中，麦克风最广泛地用于检测咳嗽。然而，处理音频信号所需的强力消耗阻碍了对电池限制的商业可穿戴产品（例如耳塞）的连续音频咳嗽检测。我们呈现了利用较低功率传感器，惯性测量单元（IMU）的COUGHTRIGGER作为咳嗽检测激活器，以触发更高功率的传感器，用于音频处理和分类。它能够以最小的电池消耗运行作为备用服务，并在从IMU检测到候选咳嗽时触发基于音频的咳嗽检测。此外，IMU的使用带来了改善咳嗽检测特异性的益处。实验是对45个科目进行的，我们的IMU的模型达到了0.77 AUC评分，留出了一个主题的评价。我们还验证了其对自由生活数据的有效性，并通过设备实现。

translated by 谷歌翻译

Deep Learning in Human Activity Recognition with Wearable Sensors: A Review on Advances

Shibo Zhang , Yaxuan Li , Shen Zhang , Farzad Shahabi , Stephen Xia , Yu Deng , Nabil Alshurafa

分类：机器学习

2021-10-31

移动和可穿戴设备已启用许多应用，包括活动跟踪，健康监测和人机互动，可衡量和改善我们的日常生活。通过利用许多移动设备和可穿戴设备中的低功耗传感器的丰富集合来执行人类活动识别（HAR），可以实现许多这些应用。最近，深入学习大大推动了哈尔的界限，在移动和可穿戴设备上。本文系统地对现有的工作进行了分类，并总结了为可穿戴性的哈尔引入深度学习方法的现有工作，并为目前的进步，发展趋势和主要挑战提供了全面的分析。我们还展示了深度学习的哈尔的前沿前沿和未来方向。

translated by 谷歌翻译

BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning for Automatic Speech Recognition

Yu Zhang , Daniel S. Park , Wei Han , James Qin , Anmol Gulati , Joel Shor , Aren Jansen , Yuanzhong Xu , Yanping Huang , Shibo Wang

分类：自然语言处理 | 机器学习

2021-09-27

我们总结了使用巨大的自动语音识别（ASR）模型的大量努力的结果，该模型使用包含大约一百万小时音频的大型，多样的未标记数据集进行了预训练。我们发现，即使对于拥有数万个小时的标记数据的非常大的任务，预训练，自我培训和扩大模型大小的组合也大大提高了数据效率。特别是，在具有34K小时标记数据的ASR任务上，通过微调80亿个参数预先训练的构象异构体模型，我们可以匹配最先进的（SOTA）性能（SOTA）的性能，只有3％的培训数据和通过完整的训练集可以显着改善SOTA。我们还报告了从使用大型预训练和自我训练的模型来完成一系列下游任务所获得的普遍利益，这些任务涵盖了广泛的语音域，并涵盖了多个数据集大小的大小，包括在许多人中获得SOTA性能公共基准。此外，我们利用预先训练的网络的学会表示，在非ASR任务上实现SOTA结果。

translated by 谷歌翻译

Conformer: Convolution-augmented Transformer for Speech Recognition

Anmol Gulati , James Qin , Chung-Cheng Chiu , Niki Parmar , Yu Zhang , Jiahui Yu , Wei Han , Shibo Wang , Zhengdong Zhang , Yonghui Wu

分类：

2020-05-16

Recently Transformer and Convolution neural network (CNN) based models have shown promising results in Automatic Speech Recognition (ASR), outperforming Recurrent neural networks (RNNs). Transformer models are good at capturing content-based global interactions, while CNNs exploit local features effectively. In this work, we achieve the best of both worlds by studying how to combine convolution neural networks and transformers to model both local and global dependencies of an audio sequence in a parameter-efficient way. To this regard, we propose the convolution-augmented transformer for speech recognition, named Conformer. Conformer significantly outperforms the previous Transformer and CNN based models achieving state-of-the-art accuracies. On the widely used LibriSpeech benchmark, our model achieves WER of 2.1%/4.3% without using a language model and 1.9%/3.9% with an external language model on test/testother. We also observe competitive performance of 2.7%/6.3% with a small model of only 10M parameters.

translated by 谷歌翻译

FacT: Factor-Tuning for Lightweight Adaptation on Vision Transformer

Shibo Jie , Zhi-Hong Deng

分类：计算机视觉

2022-12-06

Recent work has explored the potential to adapt a pre-trained vision transformer (ViT) by updating only a few parameters so as to improve storage efficiency, called parameter-efficient transfer learning (PETL). Current PETL methods have shown that by tuning only 0.5% of the parameters, ViT can be adapted to downstream tasks with even better performance than full fine-tuning. In this paper, we aim to further promote the efficiency of PETL to meet the extreme storage constraint in real-world applications. To this end, we propose a tensorization-decomposition framework to store the weight increments, in which the weights of each ViT are tensorized into a single 3D tensor, and their increments are then decomposed into lightweight factors. In the fine-tuning process, only the factors need to be updated and stored, termed Factor-Tuning (FacT). On VTAB-1K benchmark, our method performs on par with NOAH, the state-of-the-art PETL method, while being 5x more parameter-efficient. We also present a tiny version that only uses 8K (0.01% of ViT's parameters) trainable parameters but outperforms full fine-tuning and many other PETL methods such as VPT and BitFit. In few-shot settings, FacT also beats all PETL baselines using the fewest parameters, demonstrating its strong capability in the low-data regime.

translated by 谷歌翻译

Efficient View Path Planning for Autonomous Implicit Reconstruction

Jing Zeng , Yanxu Li , Yunlong Ran , Shuo Li , Fei Gao , Lincheng Li , Shibo He , Jiming chen , Qi Ye

分类：机器人

2022-09-27

隐式神经表示显示了3D场景重建的有希望的潜力。最近的工作将其应用于自主3D重建，通过学习信息获得图路径计划的信息增益。有效，信息增益的计算很昂贵，并且与使用体积表示相比，使用隐式表示为3D点进行碰撞检查要慢得多。在本文中，我们建议1）利用神经网络作为信息增益场的隐式函数近似器，以及2）将隐式细粒表示与粗量表示形式结合起来，以提高效率。随着效率的提高，我们提出了基于基于图的计划者的新型信息路径计划。我们的方法表明，与具有隐性和明确表示的自主重建相比，重建质量和计划效率的显着提高。我们将该方法部署在真正的无人机上，结果表明我们的方法可以计划信息意见并以高质量重建场景。

translated by 谷歌翻译

An Interpretable and Efficient Infinite-Order Vector Autoregressive Model for High-Dimensional Time Series

Yao Zheng , Shibo Li

分类： (统计)机器学习

2022-09-02

作为一种特殊的无限级矢量自回旋（VAR）模型，矢量自回归移动平均值（VARMA）模型比广泛使用的有限级var模型可以捕获更丰富的时间模式。然而，长期以来，其实用性一直受到其不可识别性，计算疾病性和解释相对难度的阻碍。本文介绍了一种新颖的无限级VAR模型，该模型不仅避免了VARMA模型的缺点，而且继承了其有利的时间模式。作为另一个有吸引力的特征，可以单独解释该模型的时间和横截面依赖性结构，因为它们的特征是不同的参数集。对于高维时间序列，这种分离激发了我们对确定横截面依赖性的参数施加稀疏性。结果，可以在不牺牲任何时间信息的情况下实现更高的统计效率和可解释性。我们为提出的模型引入了一个$ \ ell_1 $调查估计量，并得出相应的非反应误差边界。开发了有效的块坐标下降算法和一致的模型顺序选择方法。拟议方法的优点得到了模拟研究和现实世界的宏观经济数据分析的支持。

translated by 谷歌翻译